ارائه روش هایی برای مسئله ریشه یابی در زبان فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
- نویسنده حامد فرزانه فر
- استاد راهنما محمد رضا احمد زاده
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1389
چکیده
امروزه پیشرفت امکانات نرم افزاری و سخت افزاری، موجب آسانی ذخیره شدن مقادیر زیادی داده شده است. تعداد مستندات متنی روز به روز در حال افزایش است؛ نامه های الکترونیکی، صفحات وب، متون خبری و مقالات تنها بخشی از این گستره رو به افزایش هستند. بنابراین نیاز به تکنیک های متن کاوی همانند روش های خودکار برای رده بندی متون و بازیابی اطلاعات احساس می شود. در مسئله های متن کاوی ریشه یابی کلمات جزء مهم ترین مراحل می باشد. ریشه یابی به معنی تبدیل کلماتی که ریشه ی یکسان دارند به یک ریشه ی واحد است. ریشه یابی به منظور افزایش کارایی در متن کاوی و کاهش فضای خصیصه انجام می شود. تاکنون روش های مختلفی برای ریشه یابی کلمات در زبان های مختلف ارائه شده است. در زبان فارسی نیز در زمینه ی ریشه یابی روش هایی پیشنهاد شده است که هر یک دارای معایب و مزایایی هستند، ولی روشی کلی که در متن کاوی در زبان فارسی از آن استفاده کنند و میزان کارایی بالایی نیز داشته باشد معرفی نشده است. برای بهبود کارایی ریشه یابی در زبان فارسی در این پایان نامه دو روش جدید ارائه شده است. روش اول بر اساس مطالعه ی ساختار ریخت شناسی زبان فارسی پیاده سازی شده است. این روش یک روش ترکیبی است. در این روش جدول جستجو و اتوماتا برای یافتن ریشه مورد استفاده قرار می گیرند. این روش یک روش ایستا بوده و انعطاف پذیری بالایی ندارد به همین دلیل دچار بعضی خطاها در ریشه یابی کلمات می شود. روش دوم نیز مانند روش اول یک روش ترکیبی است. بخش اول این روش مانند روش اول با استفاده از جدول جستجو پیاده سازی شده است. قسمت دوم این روش با استفاده از الگوریتم یادگیری درخت تصمیم گیری پیاده سازی شده است. از آنجایی که روش های یادگیر پویا هستند، بخشی از ضعف های روش اول پوشانده می شوند. در نهایت به منظور مقایسه کارایی از یکی از الگوریتم های ریشه یابی متداول در زبان فارسی استفاده کردیم. همچنین یک پیش پردازش کامل برای متون فارسی پیشنهاد گردید. برای بررسی کارایی از دو روش رده بندی متون با استفاده از چندین الگوریتم معمول رده بندی و روش بازیابی اطلاعات استفاده شد. پس از بررسی نتایج به این نکته رسیدیم که در مقایسه ها روش های پیشنهادی کارایی بسیار خوبی دارند. همچنین مشاهده شد پیش پردازش پیشنهادی تاثیر بسیار بالایی بر کارایی رده بند و سیستم بازیابی اطلاعات دارد.
منابع مشابه
مکان یابی در زبان فارسی
امکانات و روشهای مکانیابی یکی از مهمترین مباحث مطرح در حوزۀ زبانشناسی شناختی است. زبان با استفاده از منابع و امکاناتی عینی مانند اعضای بدن، اشیاء و موارد موجود در طبیعت و فرایندها به مفهومسازی جهتهای مکانی میپردازد. هر زبان با توجه به مسائل تاریخی و فرهنگی خود، از برخی یا همۀ امکانات فوق استفاده میکند. با توجه به این ملاحظات، هدف این مقاله شناسایی امکانات و منابع مکانیابی در زبان فارسی...
متن کاملارائه یک مدل فازی برای مسئله مکان یابی- مسیریابی در زنجیره تامین مواد غذایی فسادپذیر
امروزه رقابتی شدن بازارها و توسعه مفاهیم مدیریتی، شرکتها را وادار به طراحی و مدیریت بهتر زنجیرههای تامین کرده است. مدیریت زنجیره تامین بر یکپارچهسازی اعضای زنجیره تاکید دارد. زیرا برای افزایش کارایی یک زنجیره تامین نمیتوان تصمیمات آن را بهطور جداگانه در نظر گرفته و به بهینهسازی آن پرداخت. از آنجایی که نقش بالای عامل مکانیابی، مسیریابی در ادامه حیات یک زنجیره تامین پوشیده نیست، لذا یکپارچ...
متن کاملارائه مرجعی برای کارکردهای ارتباطی زبان فارسی
تهیه ی مواد آموزشی به روز برای فراگیری زبان فارسی یکی از عمده ترین مسائل مربوط به آموزش زبان فارسی به دیگر زبانان است.در این زمینه استفاده از کارکردهای اجتماعی زبان در شرایط و موقعیت های متفاوت امری لازم است.هدف اصلی این پژوهش ارائه مرجعی برای به کارگیری کارکردها در تدوین مواد آموزشی برای فراگیران زبان فارسی است.دویست دانشجوی فارسی زبان در رشته های کارشناسی مترجمی زبان انگلیسی و کارشناسی ادبیات...
متن کاملمقایسهء جنبه هایی از ساخت صوتی زبان فارسی و ژاپنی
مقایسهء زبان ها یا زیرنظام های آن ها فرایندی است که حاصل آن می تواند هم به افزایش آگاهی ما دربارهء ساخت زبان ها، شباهت ها وتفاوت های آن ها منجر شود و هم در تحقق اهداف کاربردی در فعالیت های مربوط به حوزهء زبان، به ویژه در ترجمه و آموزش زبان مؤثر واقع شود. وقتی صحبت از مقایسهء دو چیزمی شود، بیشتر پی بردن به شباهت های آن ها مطمح نظر است، اما در مقابله بیشتر پیدا کردن تفاوت هامد نظر است. فرض بنیادی...
متن کاملحذف گروه فعلی در زبان فارسی: مسئله همانندی و تجویز
این مقاله به تحلیل جملاتی میپردازد که در زبان فارسی حاوی گزاره مفقود هستند. از بین دادههای ارائه شده، این بررسی تنها به دادههایی نظر دارد که در آنها گزاره محذوف معادل سازه نحوی گروه فعلی (vP) است. در این تحلیل، دو مسئله بافت نحوی (تجویز) و شرایط حذف (همانندی) این سازهها مورد واکاوی قرار میگیرد. بهطور مشخص، با اتخاذ رویکردی کمینهگرا، نشان داده میشود که تجویز ساختاری حذف گروه فعلی در ...
متن کاملحذف گروه فعلی در زبان فارسی: مسئله ساختاری
در این مقالة به بررسی و تحلیل ساخت بندهایی در زبان فارسی میپردازیم که در آنها گروه فعلی (گزاره) محذوف/مفقود است. این بحث، به لحاظ نظری در قالب دو دیدگاه ساختاری و غیرساختاری مطرح میگردد. با بهره گرفتن از دادهها و شواهدی از زبان فارسی و با اعمال آزمونهای نحوی مستقل و استانده، بهطور مشخص استدلال خواهد شد که در جایگاه حذف، ساخت نحوی متداول وجود دارد اگر چه در صورت آوایی زبان دارای بازنمون ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023